افزونه کروم Speechify قابلیتهای تایپ صوتی و دستیار صوتی را اضافه کرد

Speechify عمدتاً ابزاری بوده است که به شما کمک میکند تا به مقالات، فایلهای PDF و اسناد گوش دهید. این شرکت اکنون در حال افزودن ویژگیهای تشخیص صدا به افزونه Chrome خود است، از جمله تایپ صوتی و یک دستیار صوتی که به سؤالات شما پاسخ میدهد.
در 12 ماه گذشته، به لطف بهبود کلی کیفیت در مدلهای تشخیص گفتار، شاهد گسترش ابزارهای تشخیص صدا بودهایم. Speechify نیز با راهاندازی ابزار دیکته خود با پشتیبانی از زبان انگلیسی، به این جریان پیوسته است. درست مانند سایر ابزارهای دیکته، تایپ صوتی Speechify خطاها را تصحیح میکند و کلمات پُرکننده را حذف میکند.
در آزمایش کوتاهی که کمی بیشتر از یک روز به طول انجامید، احساس کردم که Speechify هنوز جای زیادی برای بهبود دارد. به عنوان مثال، این ابزارها به خوبی با Gmail و Google Docs کار میکنند، اما در سایتهایی مانند WordPress، در فعال کردن دیکته صوتی و عملکرد خوب آن با مشکل مواجه شدهام. این شرکت اعلام کرده است که به تدریج در حال بهینهسازی برای سایتهای محبوب است.

از نظر دقت، نرخ خطای کلمات بالاتر از برخی ابزارهای دیگر مانند Wispr Flow، Willow و Monologue بود. Speechify اشاره کرد که مدل آن با استفاده بیشتر، سریعتر یاد میگیرد و نرخ خطا به تدریج کاهش مییابد.
این استارتاپ همچنین در حال راهاندازی یک دستیار صوتی مکالمهای است که در نوار کناری مرورگر شما قرار دارد. میتوانید سؤالاتی در مورد وبسایت از آن بپرسید، مانند «سه ایده کلیدی چیست؟» یا «این را به زبان سادهتر توضیح دهید.»
در حالی که ChatGPT و Gemini حالتهای مکالمهای دارند، استدلال Speechify این است که این ویژگیها در برنامههای آنها به عنوان یک ایده ثانویه در نظر گرفته میشوند، و ابزار خود این استارتاپ صدا را در مرکز توجه قرار داده است.
روهان پاولووری، مدیر ارشد کسبوکار این شرکت، در ایمیلی به خبرنگار گفت: «ما معتقدیم که چت همیشه تجربه کاربری پیشفرض در ChatGPT و Gemini خواهد بود وقتی برنامهها را باز میکنید. این همان چیزی است که کاربرانشان انتظار دارند. صدا همیشه ثانویه خواهد بود – و در بسیاری از موارد، یک ایده ثانویه برای ChatGPT و Gemini. ما از چندین سال ساخت Speechify میدانیم که بخش بزرگی از بازار وجود دارد، که شامل کاربران ما میشود، که میخواهند صدا به عنوان تنظیمات اصلی و پیشفرض هر بار که برنامهای را باز میکنند و با هوش مصنوعی صحبت میکنند، باشد.»
یکی از موانع قابل توجه در این مورد این است که دستیار Speechify در حال حاضر با مرورگرهایی که دارای دستیارهای داخلی نوار کناری مانند Atlas OpenAI، Coment Perplexity و Dia هستند، کار نمیکند. این استارتاپ زیاد نگران این موضوع نیست زیرا این افزونه عمدتاً برای Chrome و پایگاه کاربری گسترده آن در نظر گرفته شده است.
Speechify اعلام کرد که قصد دارد به تدریج تایپ صوتی و یک دستیار صوتی را در تمام برنامههای خود در سراسر دسکتاپ و موبایل قرار دهد.
این استارتاپ همچنین میخواهد به توسعه عواملی بپردازد که وظایف را از طرف شما انجام میدهند. این استارتاپ نقشه راه کامل خود را فاش نکرد، اما یک مثال ارائه داد: برقراری تماس برای شما برای تعیین وقت ملاقات یا منتظر ماندن در صف پشتیبانی مشتری یک شرکت. شرکتهای دیگری مانند Truecaller و Cloacked نیز اهداف مشابهی را دنبال کردهاند.



